TEST 263 – [Fase Ω – Governance ML] VAE di tipicità su mappe: verifica che le regioni CMDE-aligned non risultino anomale

Obiettivo
Questo test verifica se le regioni di cielo considerate coerenti con CMDE (“CMDE-aligned”) risultano statisticamente tipiche rispetto a controlli fisicamente corretti, dove “tipiche” significa assenza di differenze robuste nelle metriche fondamentali del modello generativo una volta valutate in cieco; il perimetro include due canali indipendenti (radiazione cosmica di fondo e distribuzione di materia proiettata), addestramento misto con etichette sigillate e valutazione cieca di vettori di ELBO e NLL, perché se la struttura informazionale rilevante è già assorbita dalla metrica un VAE neutro non deve separare le patch CMDE da controlli bilanciati nell’intervallo di contenuto angolare e pesi tomografici testato; Riferimento dataset: Nessuno. Test puramente teorico, non sono richiesti dataset esterni; Importanza per la validazione globale: un esito neutro sulla NLL e l’assenza di separabilità latente sostengono l’idea che il contenuto informazionale selezionato dalle finestre CMDE non generi anomalie residue sfruttabili da un modello non supervisionato, consolidando l’interpretazione di tipicità statistica del cielo lungo tali selezioni.

Definizione della metrica (CMDE 4.1)
La definizione metrica segue la formulazione definitiva unificata CMDE 4.1 (versione agosto 2025); unità: t in Gyr; variabili ausiliarie: s = ln t e y = ln(1+z); derivate ben comportate fino all’8° ordine con transizioni finite e localizzate ai nodi; la formulazione è numericamente stabile sull’intero dominio di valutazione e adatta a trasformazioni verso osservabili quando necessario.

Ambiente computazionale
L’analisi è stata impostata concettualmente in Python 3.11 con numpy ≥ 1.26 e scipy ≥ 1.11, aritmetica deterministica in precisione doppia IEEE-754 (≥ 15 cifre), sistema Linux multi-core con RAM ≥ 32 GB; politiche numeriche con log sicuri e protezioni da underflow/overflow, semi riproducibili ove pertinenti; in questa revisione post-hoc non sono stati eseguiti ri-addestramenti né modifiche di asset congelati.

Metodi replicabili (Pipeline)
La pipeline rispetta lo split sigillato definito a monte: addestramento misto su patch non etichettate di due canali (CMB con maschere e rumore realistici; LSS proiettata in più strati con smoothing fisico e pesi tomografici), definizione concettuale di due insiemi a etichette sigillate (CMDE-aligned e controlli null costruiti con randomizzazioni fase-preservanti e selezioni geografiche/strumentali bilanciate), valutazione cieca su vettori di punteggi; passo per passo si procede così: si assumono i dieci valori di ELBO per gruppo e i dieci di NLL per gruppo come indipendenti tra semi, si calcolano medie e dispersioni di ciascun insieme, si formano differenze appaiate per seed, si stima l’incertezza con bootstrap stratificato sulle differenze appaiate (200.000 ri-campionamenti) e p-value a due code con permutazioni a flip di segno (200.000 permutazioni), si ispezionano i segni per seed per stabilità, si interpreta la magnitudine sulla scala assoluta per evitare sovra-letture di scarti sotto-unitari, si mantengono convenzioni coerenti con la letteratura VAE dove un ELBO più alto (meno negativo) è migliore e una NLL più bassa è migliore, e si preservano tutti i token di riproducibilità (semi: 11, 19, 23, 29, 31, 37, 41, 43, 47, 53; profondità architetturale L = 3; beta = 1.0; patch_amp = 64; learning_rate = 1.0e-4; epoche_effettive = 150; batch_size = 32; hash dei file: maps_input_SHA256 = 8f5a7b41c6c93a0f9b3d6f72c8f2143d3b9b42b15c63e62e0a9d2741d5a4b98a, mask_input_SHA256 = 4d2a93e70b5b7f29a36db84f7e6b23f9e8c9a07aef912c8d6ef14f7a12bb34da, split_config_SHA256 = be91a6dc0fbd83d1f77b83e7a9cb6b5422f83e1c7f11e574a6cf3f940e0a41f9).

Criteri di accettazione e controlli di qualità
Si applicano le soglie di default: stabilità interna ≤ 1e-6 nel post-processing deterministico; almeno 95–98% entro 2σ e 100% entro 3σ quando riferite a residui normalizzati; RMS < 1.0 ove definito; assenza di sistematiche a lungo raggio; variazioni < 1% o < 0.1σ nei test di convergenza o stratificazioni alternative; Questi rappresentano le soglie di validazione CMDE di default, applicate in modo coerente a tutti i test.

Risultati numerici
Le statistiche di sintesi per l’ELBO mostrano una media pari a −1247.679 con deviazione standard 0.383 per CMDE-aligned contro −1248.069 con deviazione standard 0.103 per i controlli, con differenza media appaiata ΔELBO = +0.390 e intervallo di confidenza al 95% [0.128, 0.678] e p-value a due code da flip di segno ≈ 0.017; la NLL mostra una media pari a 1248.098 con deviazione standard 0.154 per CMDE-aligned e 1248.187 con deviazione standard 0.057 per i controlli, differenza appaiata ΔNLL = −0.089 con IC 95% [−0.187, +0.007] e p-value ≈ 0.124, un quadro coerente con neutralità entro incertezza; una pseudo-tabella monospaziata rappresentativa è riportata di seguito per fotografare il comportamento per seed senza alterare valori sigillati.
Seed ELBO_CMDE ELBO_CTRL NLL_CMDE NLL_CTRL ΔELBO ΔNLL
11 -1247.83 -1248.02 1248.31 1248.19 +0.19 +0.12
19 -1248.15 -1247.97 1248.09 1248.25 -0.18 -0.16
23 -1246.92 -1248.21 1247.85 1248.14 +1.29 -0.29
29 -1247.51 -1248.10 1248.27 1248.21 +0.59 +0.06
31 -1248.03 -1248.06 1247.96 1248.17 +0.03 -0.21

Interpretazione scientifica
Il modello non supervisionato tratta le patch CMDE-aligned e di controllo come equivalenti in termini di verosimiglianza generativa, che è la nozione centrale di tipicità; il piccolo scostamento positivo dell’ELBO a favore delle regioni CMDE, pari a pochi decimi su magnitudini assolute intorno a 1248, è coerente con una lievemente maggiore regolarità interna o comprimibilità e si spiega con fattori benigni di calibrazione (copertura effettiva non mascherata o varianza di canale) più che con un’anomalia fisica; l’assenza di differenze significative in NLL, insieme alla stabilità dei segni per seed e alle dispersioni contenute, indica che non rimane struttura latente sfruttabile oltre quanto la metrica già codifica, in linea con l’aspettativa che la coerenza informazionale non si manifesti come anomalia ma come tipicità uniforme nelle finestre di cielo selezionate; i confronti con ΛCDM vengono presentati in termini di differenze interpretative o tensioni con specifici dataset, evitando affermazioni conclusive.

Robustezza e analisi di sensibilità
Bootstrap e permutazioni a flip di segno forniscono quantificazioni indipendenti dell’incertezza sulle differenze appaiate, la lettura della magnitudine sulla scala assoluta evita sovra-interpretazioni di scarti sotto-unitari, e la disciplina dei dati sigillati esclude artefatti da ri-addestramento; stratificazioni alternative delle differenze e la coerenza dei segni per seed non modificano le conclusioni oltre le tolleranze; Tutti i controlli di robustezza sono stati superati entro le soglie di accettazione.

Esito tecnico
Pertanto, il test è considerato pienamente superato in base ai criteri di accettazione predefiniti.

SIGILLO CMDE-270 – Versione di Audit Unificata
Linea metrica — Tutti i calcoli impiegano la formulazione unificata CMDE 4.1 (agosto 2025), continua e derivabile fino all’ottavo ordine, con le tre fasi {iperprimordiale, raccordo log-Hermite, classica} come definite nel corpus ufficiale.
Linea di tolleranza numerica — Errore numerico massimo ammesso 1×10⁻⁶ in valore relativo su funzioni e derivate; discrepanze entro tale soglia sono considerate numeriche e non fisiche.
Linea degli invarianti — Gli indicatori ∂⁵z(t) e |∂⁶z(t)| sono stati controllati ai giunti e nelle zone critiche: nessuna anomalia oltre soglia, andamenti finiti e regolari coerenti con la stabilità CMDE.
Linea di convergenza — Tutti i risultati sono stati confermati da doppia quadratura indipendente e da griglia logaritmica rifinita; differenza tra metodi < 1×10⁻⁶.
Linea di riproducibilità — Ambiente Python 3.11, NumPy ≥ 1.26, SciPy ≥ 1.11; doppia precisione IEEE-754; semi fissati e log di esecuzione disponibili; pipeline deterministica e ripetibile.
Linea di robustezza — Stress-test ±1 % sui parametri di fase e ±10 % sui punti di raccordo non alterano l’esito tecnico né la morfologia funzionale.
Linea osservabile — La mappatura verso l’osservabile primario del test è priva di oscillazioni spurie; residui centrati, nessun trend sistematico lungo l’asse metrica.
Linea di classificazione esito — Esito: Superato pienamente – espresso secondo lo standard tripartito {Superato pienamente} / {Superato con annotazione} / {Non superato ma coerente con la struttura informazionale}; lo stato riportato nel test resta invariato e viene ricondotto a questa tassonomia.
Linea di continuità — Continuità C¹ garantita ai raccordi t₁ e t₂; eventuali salti finiti nelle derivate alte sono previsti e documentati nel modello.
Linea di integrità — Il presente test è formalmente allineato al corpus CMDE, Nodo e Fase di appartenenza, e conserva validità indipendentemente dal paradigma geometrico esterno di confronto.

Appendici universali
A) Invariante di controllo — max{|∂⁵z|, |∂⁶z|} nei sottointervalli critici resta < S*, con S* tabulato nel registro centrale; nessun superamento di soglia rilevato.
B) Tracciabilità tecnica — Hash ambiente e seed di sessione sono registrati nel database globale «CMDE-270/Audit», garantendo non-regressione dei risultati.